机器生成的语音的特点是其有限或不自然的情绪变化。目前的语音系统文本与扁平情绪,从预定义的集合中选择的情感,从培训数据中的韵律序列中学到的平均变异,或者从源样式转移。我们向语音(TTS)系统提出了文本,其中用户可以从连续和有意义的情感空间(唤醒空间)中选择生成的语音的情绪。所提出的TTS系统可以从任何扬声器风格中的文本产生语音,具有对情绪的精细控制。我们展示该系统在培训期间无知的情感上的工作,并且可以鉴于他/她的演讲样本来扩展到以前看不见的扬声器。我们的作品将最先进的FastSeech2骨干的地平线扩展到多扬声器设置,并为其提供了多令人垂涎的连续(和可解释)的情感控制,而没有任何可观察到的综合演讲的退化。
translated by 谷歌翻译
域泛化(DG)被认为是泛广泛化的前面。我们提出了经验证据表明,DG泛化的主要原因是训练时存在多个域。此外,我们表明IID中的泛化方法对DG的泛化同样重要。量身定制的方法未能在传统的DG(TDG)评估中增加性能增益。我们的实验提示如果TDG已经在评估ood泛化方面存在的有用性?为了进一步加强我们的调查,我们提出了一种新颖的评估策略,Classwise DG(CWDG),在这里,每个班级,我们随机选择一个域并将其保留在一边进行测试。我们认为,这项基准测试更接近人类学习,并在现实世界方案中相关。反直观地,尽管在培训期间暴露于所有域,但CWDG比TDG评估更具挑战性。在解释观察的同时,我们的作品在探索新想法之前,我们的作品在DG问题上进行了更重要的分析。
translated by 谷歌翻译
差异隐私对于具有严格的隐私保证的统计和机器学习算法的现实部署至关重要。为了释放样品平均值,最早开发了差异隐私机制的统计查询。在几何统计中,样本fr \'echet均值代表了最基本的统计摘要之一,因为它概括了属于非线性歧管的数据的样本均值。本着这种精神,到目前为止,已经开发出差异隐私机制的唯一几何统计查询是用于释放样本fr \'echet的含义:最近提出了\ emph {riemannian laplace机制},以使FR私有化FR私有化\'echet的意思是完全riemannian歧管。在许多领域中,对称正定(SPD)矩阵的流形用于对数据空间进行建模,包括在隐私要求是关键的医学成像中。我们提出了一种新颖,简单且快速的机制 - \ emph {切线高斯机构} - 以计算赋予二型e echet的差异私有fr \'echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet echet含量均为ecly -eeclidean riemannian metric。我们表明,我们的新机制在当前和仅可用的基线方面就数据维度获得了二次实用性改进。我们的机制在实践中也更简单,因为它不需要任何昂贵的马尔可夫链蒙特卡洛(MCMC)采样,并且通过多个数量级的计算速度更快 - 如广泛的实验所证实。
translated by 谷歌翻译
我们考虑在非参数环境中对高阶希尔伯特空间的高阶估计估计。我们提出的估计器缩小了Bochner积分量的$ U $统计估计器,而不是希尔伯特领域的预指定目标元素。根据$ u $统计的内核的退化,我们构建了一致的收缩估计量,并具有快速的收敛速度,并产生了Oracle不平等,比较了$ u $统计估计器的风险及其收缩版。令人惊讶的是,我们表明,通过假设$ u $统计的内核完全退化而设计的收缩估计器也是一致的估计器,即使内核不是完全退化。这项工作涵盖并改进了Krikamol等人,2016年,JMLR和Zhou等,2019,JMVA,它仅处理繁殖的内核Hilbert Space中的平均元素和协方差操作员估计。我们还将结果专注于正常的平均估计,并表明对于$ d \ ge 3 $,拟议的估算器严格根据平均误差的样本平均值进行了改进。
translated by 谷歌翻译